データ視覚化のデザイン
用語の整理
データ可視化、データビジュアライゼーションとも言う
人間の視覚情報処理の特性を意識し、情報の伝達を行うもの
データ視覚化したものへエンコーディングした表現のこと
データを見て理解を促進させる視覚的表現
第1章 データ視覚化「キモのキモ」
「データ視覚化」とは、単に手元にあるデータをグラフにすることではない
いくらデータを視覚化しても、その中から人間が重要な情報を読み取れなければ意味がない
人間が重要な情報を読み取れないデータの視覚化は、データ視覚化の用をなさない
「用をなす」データ視覚化を行うためには、データ以前に人間の認知システムの特性を理解する必要がある
人間の認知システムにとって理解しやすい視覚化ができているからこそ、人間はデータの中に潜む傾向を読み取れる
データ視覚化とは、「データの中に潜む重要な情報を、人間の視覚-認知脳神経が検出しやすくなるように、データの表現形式を変換すること」
データの表現形式をハックすることで、人間の持つ情報を読み取る能力をブーストする技術体系
データ視覚化の目的
統計はデータの傾向を客観的に把握できる強力なツール
「平均、分散、相関係数」などの統計量だけでは、表せないデータの傾向がある
=> データ視覚化が必要な、もっとも本質的な理由
統計的指標と視覚化は対立概念ではなく、両者の力を一緒に使うことに大きな価値がある
何か1つの指標(「平均」)を見るだけでは、分析したい対象の分布や推移などの「真の姿」は見えない
コラム プレ視覚化作業
データは「分析用」に存在していることは稀で、そのまま視覚化すればうまくいくようなものはほとんどない
前処理でクレンジング、洗練するのは宿命
「前処理」工程もデータ視覚作業の一部
前処理の企画・設計・実装の着想が早く出るようになると、データ視覚化の幅が広がり、スピードが上がる
正規表現の使いこなし
「計算量」に対する感覚
1-7 認知的負荷を下げる
オーディエンスが、何か新たな情報を脳が受ける時、認知的負荷が掛かっている
近接の法則(Low of Proximity)
類同の法則(Low of Similarity)
囲みの法則(Low of Enclosure)
閉合の法則(Low of Closure)
連続の法則(Low of Continuity)
接合の法則(Low of Connection)
Clutter(クラター)を回避せよ
「ごちゃごちゃしている状態」を回避すべき
認知的負荷を取り除く作業
データ視覚化においては、人間が重要な情報を瞬時に理解できるように、視覚属性とデータタイプを意識することがキモのキモ
第2章 これだけでグッとプロっぽくなるコツ
2-1 色
使う色の数を減らすこと
グレースケールを基調とするとシンプルにまとめることができる
色は、データ視覚化を「おしゃれ」に装飾するものではない
カラーパレット
https://color.adobe.com/ja/create/color-wheel
適切な配色利率の目安
ベースカラー 70-80%
メインカラー 10-20%
強調カラー 5%
2-2 テキスト
データ視覚化とは、単にチャートを量産することではない
効果的なテキスト(文字)の利用もデータ視覚化の一部
テキストの役割
主題を明示する
ラベルを付与する
操作を促す(ガイド)
ハイライトさせる
説明する
文脈を補足する
詳細を補足する
多くの人のダッシュボードでは、オーディエンスがすべき操作のガイドを全くしていない
自分自身のデータ分析や視覚化が進むと、初見の感覚を忘れてしまう
自分がわかるのだから、相手もわかるだろうと考えてしまう
主題を明示する
「これは何の分析・視覚化なのか」を伝える役割
「伝えたいメッセージを明確にする」
同じデータを使っても、タイトルや見せ方が変わると主題も変わる
オーディエンスは明示された主題の通りに理解しようとするため、主題と合わせてデータ視覚化を整えていくのは重要
効果的なタイトル、サブタイトル
タイトルはオーディエンスが最初に目にするもの
作成者がデータ視覚化で何をしようとしているのかを理解する最初のきっかけとなる
オーディエンスを誤解させることがあってはならない
ラベル
データ視覚化のリファレンス(参照)として機能する
ラベルを出せばグリッドラインや軸を削除してもよい場合がある
罫線を削除できて、チャートをすっきりと表示できる
BANs(Big A$$ Numbers)
重要なことは大きく表示せよ
BANsのTips
重要な指標は大きなフォントでインパクトを最大に
色をつける
動的にする
余白を十分に取る
フォント
おすすめフォント
Century Gothic
Arial
Trebuchet MS
Verdana
Times New Roman
Lucida sans
Consoias
Segoe UI
メイリオ
ヒラギノ角ゴシック
コラム 完璧なものよりアウトプットを出す速さを意識する
BIを使う大きなメリットは、結果が出てくる速さ
トライアンドエラーが簡単にできるのは大きなアドバンテージ
データに接続すらしてないのに構えすぎて考え込んでしまい止まってしまうのはもったいない
なぜアウトプットを早く出し続けることが重要なのか?
アウトプットは常に「具体的」だから
クオリティがイマイチでも、自身がなくても外に出すこと
具体的なものがなければ、具体的なフィードバックが得られない
具体的なものがなければ、良いか悪いかを具体的に議論できない
具体的なアウトプットを出す速さを意識することこそ、最終的なデータ分析やデータ視覚化の価値にドライブをかけるもの
価値は、常に具体的なものに宿る
2-3 レイアウト
ビジネスユースのダッシュボードの配置戦略としては、下図のレイアウトがリスクの少ない基本レイアウト
データ視覚化は、データから人間の視覚−認知神経系への翻訳
重要なのは「かっこよさ」ではなく相手に正しく伝わるかどうか
所感
具体的なアウトプットをより早く出して、そのアウトプットを元に議論することが大事
「コラム」に書いてある内容が刺さる